查看原文
其他

聚焦下一代计算机视觉技术,蚂蚁技术研究院4篇论文入选NeurIPS

近日,世界顶尖AI学术会议“神经信息处理系统大会”(NeurIPS 2022)公布论文接收结果,成立一年的蚂蚁技术研究院共四篇论文被录用,研究成果聚焦下一代计算机视觉技术的前沿问题。


NeurIPS(Neural Information Processing Systems)是全球最负盛名的机器学习和计算神经科学领域顶级会议之一,讨论内容包含机器学习、计算机视觉、自然语言处理、神经科学等领域,其收录论文代表了相关研究的最高水平,也是未来技术发展的重要风向标。今年NeurIPS共收到 10411 篇论文投稿,接收率为 25.6%。


在数字化变革的历史机遇和科技引领创新的趋势下,蚂蚁集团于2021年中正式成立蚂蚁技术研究院,致力于前沿科学技术的探索与研究。研究院下设六大实验室,分别为数据库实验室、图计算实验室、隐私计算实验室、编译器实验室和视觉智能实验室。此次中稿的四篇论文,来自视觉智能实验室,这也是该实验室在ICML 2022(国际机器学习大会)上成功中稿两篇论文后的又一顶级大会入选。

视觉智能实验室主要从事新一代计算机视觉方向基础算法的研究工作,具体包括视觉资产(如图片、视频、三维视觉资产等)的编辑与创造,主要用于辅助设计、人机交互、低碳社交;神经网络的可解释性与深度学习理论,主要用于理解模型的内在工作原理、进一步方便使用者使用、提高人与机器的信任度;跨模态大规模表征学习,主要用于突破计算机视觉与其他领域(如自然语言)的壁垒、提高模型的通用性和可扩展性。


四篇入选论文分别是:


一, Rank Diminishing in Deep Neural Networks ,作者是Ruili Feng、Kecheng Zheng、Yukun Huang、Deli Zhao、Michael Jordan、Zheng-Jun Zha。本篇论文首次对常用的神经网络每层的秩进行了实验估计和实证分析,还揭示了由深度网络秩递减引起的独立性缺失现象,即给定类别的分类置信度可以由少数其他类别的置信度线性决定。这项工作的理论结果和实验结果促进对深层神经网络内在原理的理解。


二, Improving 3D-aware Image Synthesis with A Geometry-aware Discriminator ,作者为Zifan Shi、Yinghao Xu、Yujun Shen、Deli Zhao、Qifeng Chen、Dit-Yan Yeung。本论文作为3D生成工作的先驱之一,提出了新的3D生成范式,不同于之前的3D生成只关注改进生成器而直接使用2D判别器,本文认为判别器应该与生成器一样具有3D感知能力,才能构成公平的对弈过程,并提出了在判别器中加入一个几何分支用来从图片提取几何信息,提取出的几何信息将被用于监督生成器生成的几何。如此,判别器不仅要进行真假判别,还要对图片中的3D信息有所感知。实验结果证明,有了这样公平的对弈过程,生成的几何质量和图片的多视角连续性有了很大的提升。研究成果未来可用于内容生成,AR/VR等应用场景。


三,  Improving GANs with A Dynamic Discriminator ,作者分别是Ceyuan Yang*、Yujun Shen*、Yinghao Xu、Deli Zhao、Bo Dai、Bolei Zhou。在之前的工作中,判别器的网络学习能力在训练中都是固定的,这会导致判别器处于次优状态,从而生成器也无法达到更优解。本文提出两种不增加额外计算量的判别器能力动态调节的训练方式。在训练数据充足的情况下,判别器会逐渐增加自己的网络学习能力;而在训练数据较少的时候,判别器会逐渐减少自己的网络宽度以缓解过拟合问题。通过这两种动态的判别器学习模式,判别器获得更优解从而使得2D或3D的生成器得到了更好的监督。该研究揭示了判别器在生成对抗网络中的重要性,研究成果未来可用于提高内容生成的质量等。


四, Uncertainty-Aware Hierarchical Refinement for Incremental Implicitly-Refined Classification  , 作者是Jian Yang、Kai Zhu、Kecheng Zheng、Yang Cao。本文针对真实环境中语义粒度不确定的问题,动态构建持续学习过程中的语义继承和冲突关系,并以此引导增量模型的精炼优化方向。未来有望在此基础上实现动态模型的按需学习,根据用户或环境需要的语义粒度进行特定的层级构建以及学习认知。


今年蚂蚁集团正式启动数字普惠、绿色低碳、科技创新、开放生态四位一体的ESG可持续发展战略,此次蚂蚁技术研究院获选论文作者中包含了多位学界专家和高校青年研究人才,从中也体现出开放创新的研究路线。如论文 Rank Diminishing in Deep Neural Networks 的作者之一是机器学习先驱、加州大学伯克利分校电气工程与计算机科学系教授Michael I. Jordan,现为蚂蚁集团科技智囊团主席。他为无监督机器学习的发展做出了突出贡献,曾被Science评为“全世界最有影响力的计算机科学家”。此外,来自中国科学技术大学、香港科技大学、香港中文大学共5名蚂蚁集团研究型实习生参与到了4篇论文的撰写中。蚂蚁技术研究院今年发布了研究型实习生项目,通过开放蚂蚁集团的真实产业场景及技术资源,给青年技术研究人才提供一线的实践平台,推动产学研融合。


近年来,蚂蚁集团持续投入前沿技术,布局隐私计算、区块链、图计算、分布式数据库和绿色计算五大数字化“根技术”,根据公开信息,蚂蚁集团连续3年科研投入增长率超39%,目前在职员工技术人才占比达63%,在全国工商联发布的“2022民营企业研发投入”榜单中排名全国第六。

继续滑动看下一个
蚂蚁技术AntTech
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存